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基于 知识 图 谱 的 学 科 单 选 题 考点 提取 研究 
然 ? 骆 力 明 


(首都 师范 大 学 信息 工程 学 院 , 北京 100048) 


摘 要 : 在 人 工 智能 快速 发 展 的 今天 ， 智 能 教育 逐渐 成 为 一 大 研究 热点 。 在 自然 语言 处 理 方面 对 智能 教育 中 智慧 学 习 

的 探究 ,提出 根据 知识 图 谱 和 学 科 规则 确定 单 选 题 考点 ,主要 介绍 知识 图 谱 的 构建 和 单 选 题 考点 的 提取 这 两 方面 内 容 。 
过 建立 一 个 开放 性 的 知识 图 谱 , 不 断 实 现 学 科 知 识 的 扩充 。 为 提取 考点 ,首先 将 单 选 题 分 类 、 分 词 以 及 替换 相似 词 ， 

然后 通过 检索 图 谱 得 到 单 选 题 的 候选 考点 集 ， 最 后 通过 学 科 规 则 定位 知识 点 及 其 所 属 章节 ， 便 于 学 生 有 针对 性 地 复习 

教材 知识 。 在 所 收集 的 C++ 试题 集 上 的 实验 结果 表明 ， 通 过 知识 图 谱 和 规则 可 较为 准确 地 提取 出 试题 考点 。 
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Research on extraction of subject single knowledge points based on knowledge map 
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Abstract: At present, artificial intelligence develops rapidly, intelligent education has gradually become a hot research. This 
paper is a study of intelligent learning in intelligent education in the aspect of natural language processing. This paper proposed 


to determine the single choice knowledge according to the knowledge map and discipline rules. It mainly introduced the 


construction of knowledge map and the extraction of the single choice knowledge, through the establishment of an open 


knowledge map, expand the subject knowledge. In order to extract the test knowledge, first, classification of single choice, word 


| 人 segmentation and replacement of similar words, then, the candidate knowledge set of single choice can be obtained by searching 


the knowledge map, finally, through the discipline rules to locate the knowledge points and their chapters, help students to 


targeted review the knowledge of teaching materials. The experimental results on the collected C++ test set show that the test 
points can be accurately extracted by knowledge map and rules. 
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教学 系统 (ITS)、 智 能 决策 支持 系统 、 智 能 计算 机 辅助 教学 (CAI) 

系统 发 展 迅速 ”， 出现 了 一 系列 的 教育 智能 产品 。 例 如 ， 讯 飞 畅 
近年 来 ， 人 工 智能 (artificial intelligence) 对 社会 各 领域 的 。” 言 智慧 校园 不 仅 可 以 帮助 教师 有 针对 性 地 安排 教学 进度 和 内 容 ， 
影响 正 逐 渐 加 深 , 现 如 今 , 它 已 经 渗入 到 了 金融 、 医疗、 农业 、 而 且 可 以 根据 学 生 综合 素质 发 展 情况 进行 个 性 化 指导 和 差异 化 
国防 和 环保 等 领域 。 人 工 智 能 技术 在 金融 行业 已 被 广泛 应 用 。 教学 ; 基于 物 联网 技术 的 HappyClass 智慧 课堂 系统 ， 可 实现 教 
以 国内 著名 的 电子 商务 公司 一 一 阿里 巴巴 为 例 ， 利 用 人 工 智能 。” 师 与 学 生 双向 实时 “一 对 多 ”互动 教学 , VR、AR 情境 教学 等 ; 
技术 ， 在 客户 服务 、 征 信 、 智 能 投 顾 、 保 险 、 互 联网 小 贷 等 多 ”基于 现实 世界 中 的 各 种 校园 信息 ， 腾 业 智 慧 校 园 建立 了 一 种 虚 
个 领域 进行 创新 和 应 用 [1]; 在 医疗 领域 ， 人 工 智能 技术 已 被 初 ” 拟 教 育 环境 。 
步 应 用 在 智能 诊断 、 智 能 治疗 、 日 常 化 护理 、 人 性 化 医疗 等 方 然 语 言 处 理 是 人 工 智能 领域 的 一 个 重要 分 支 ， 它 的 目的 
面 [2]; 在 智慧 农业 方面 ， 利 用 数据 采集 技术 、 无 线 通 信 技 术 和  ” 是 让 计算 机 理解 人 类 的 自然 语言 ， 从 而 实现 用 自然 语言 与 计算 


计算 机 技术 对 大 型 塑料 温室 进行 智能 化 监测 、 管 理 和 控制 ， 提 机 进行 交流 申 。 自 然 语言 处 理 技术 在 教育 领域 的 应 用 越 来 越 
高 农业 信息 化 水 平 [3] 。 泛 ， 有 研究 者 将 其 概括 为 以 下 四 方面 外: 文本 的 分 析 与 知识 管 
人 工 智能 与 教育 也 在 不 断 地 融合 与 发 展 ， 专 家 系统 、 智 能 里， 如 作文 自动 评价 等 ， 人 工 系统 的 自然 语言 界面 ， 如 智能 问 
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软件 系统 实现 . 
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答 系 统 等 ， 语 料 库 在 教育 中 的 应 


j， 如 基于 语料库 的 数据 挖掘 


工具 等 ;面向 语言 教学 下 


上 
上 


究 的 应 用 ， 如 计算 机 辅助 语言 教学 等 


本 研究 着 眼 于 教学 中 的 考试 环节 ， 在 学 科 考 试 中 ， 单 选 题 
有 着 题 量 大 、 考 查 面 广 等 特点 ， 快 速 提取 单 选 题 考点 ， 可 以 帮 


助 学 生 及 时 了 解 学 科 知 识 


的 薄弱 环节 ， 从 而 有 的 放 矢 地 填补 缺 


漏 ;把 题目 考点 定位 到 教材 章节 , 可 以 帮助 学 生 学 习 章节 知识 ， 


故 图 谱 知 识 点 是 按照 教材 章节 组 织 的 。 

标注 单 选 题 的 考点 后 ， 笔 者 发 现 根据 考点 分 布 位 置 可 将 单 
选 题 分 为 两 类 : 一 类 是 通过 分 析 题 目 便 可 确定 具体 考点 的 单 选 
题 ; 另 一 类 是 通过 分 析 题 目 和 选项 才能 决定 具体 考点 的 单 选 题 。 


分 类 后 ， 使 用 分 词 、 同 义 词 蔡 换 技术 对 文本 进行 处 理 ， 接 着 用 
题 中 词语 匹配 图 谱 中 知识 


一 种 特殊 的 1 


刘 一 然 ， 等 : 基于 知识 


两 种 原因 ， 一 是 


Ghinax iv 合 作 | 
图 庶 点 提取 研究 


谱 的 学 科 单 选 题 


青 况 是 候选 考点 集 由 多 个 基本 知识 点 组 成 ， 
丸 为 题 中 存在 主题 知识 点 词汇 及 其 多 个 基本 知 


合 后 可 得 到 多 个 基本 知识 点 ;二 是 因为 含义 不 


相同 的 领域 关键 词组 
时 会 将 这 些 含义 不 同 的 考点 全 部 提出 。 
考点 ， 笔 者 针对 学 科 知 识 点 建立 了 学 科 规 则 。 


成 ， 若 题目 中 存在 这 些 关 


识 点 的 描述 ， 组 
同 的 考点 可 能 
键 词 ， 则 在 匹 
为 得 到 准确 
以 上 描述 的 具体 细节 将 在 第 3 章 中 介绍 。 


1.3 数据 集 介 绍 
1.4 学 科教 材 


本 石 
中 的 知识 点 是 


点 的 关键 词 ， 得 到 候选 考点 集 ， 最 后 


依据 学 科 规 则 得 到 准确 知识 点 。 


1 ”系统 整体 架构 


图 1 给 出 了 基于 知识 图 谱 提 取 单 选 题 考点 的 系统 架构 。 人 逻 


辑 上 分 为 两 层 ， 语 料 处 理 层 和 检索 知识 点 层 。 


[六 根据 题 有 确定 考点 
| 


分 记分 词 是 寿 淮 确 上 EE 半 人 机 交互 添加 新 


的 单 选 题 | 
分 河 


一 4 根据 题目 和 选项 确定 考点 的 单 选 题 


相似 词 普 换 | 


六 点 上 起 则 | 候选 考点 集 卡 位 案 | ”知识 图 庶 


图 1 基于 知识 图 谱 提取 单 选 题 考点 的 系统 架构 


1.1 语 料 处 理 

这 一 过 程 可 分 为 题目 
步 。 

1) 题 目 分 类 。 根 据 建 
知识 点 的 提取 方式 : 


究 力图 使 单 选 题 考点 对 应 到 具体 的 教材 


着 他 ， 故 图 谱 


安 照 其 所 属 章节 组 织 的 。 在 分 析 了 章节 标题 及 其 
对 应 内 容 后 ， 笔 者 发 现 章节 标题 中 的 领域 


沁 
NM 
避 | 


词 通常 是 一 个 主题 


知识 点 ， 从 其 具体 的 章节 内 容 中 可 提取 出 该 主题 知识 点 下 的 许 
多 具体 知识 点 ， 故 学 科 知 识 图谱 的 完整 性 一 方面 取决 于 领域 专 
家 对 章节 知识 的 总 结 是 否 全 面 ， 男 一 方面 取决 于 所 选取 的 教材 
内 容 是 否 完 整 。 


本 硬 
算 机 专业 
一 个 考试 科 
子 工业 出 


究 选 取 大 学 课程 C++ 作为 实验 对 


| 象 ， 它 既是 一 种 被 计 


学 生 广泛 使 用 的 编程 语言 ， 又 是 计算 机 二 级 考试 中 的 


， 故 其 有 着 十 分 中 要 的 教学 地 位 。 本 实验 选用 电 


版 社 出 版 的 由 杜 茂 康 等 人 编著 的 《C++ 加 


ij 向 对 象 程序 


设计 《第 2 版 )》 这 本 教材 ， 该 书 是 高 等 学 校 工程 创新 型 “十 二 


分 类 、 语 料 分 词 以 及 相似 词 蔡 换 这 三 


立 的 模板 对 题目 分 类 ， 从 而 决定 后 续 


QO 只 对 单 选 题 题 目 进行 分 析 。 


乌 对 整 道 试题 (题目 


及 其 选项 ) 进行 分 析 。 


2) 语 料 分 词 。 系统 中 的 分 词 模 块 是 开放 式 的 , 通过 人 机 交 


互 ,用 户 可 以 向 自 定义 词 


切中 添加 新 词 , 从 而 提高 分 词 准确 率 。 


心 


3) 相 似 词 替换 。 归 纳 总 结 试题 以 及 课本 中 语义 相同 的 词语 ， 


据 此 构造 相似 词典 并 利用 
从 而 提高 知识 点 检索 的 准 


该 词典 统一 题 中 词汇 为 一 常见 表达 ， 
确 性 。 


上 述 三 步骤 的 细节 将 


在 第 2 章 中 作 详 细 描述 。 


1.2 检索 知识 点 
此 过 程 需 学 科 知识 图 


词汇 与 知识 图 谱 中 储存 的 


谱 的 参与 ， 将 上 一 流程 得 到 的 单 选 题 
知识 点 的 关键 词 进行 还 配 ， 匹 配 成 功 


的 知识 点 构成 该 题 的 候选 考点 集 。 该 考点 集 由 基本 知识 点 和 主 
题 知识 点 构成 ， 即 ， 如 果 题 目 考查 某 一 主题 下 的 基本 知识 点 ， 


则 匹配 时 会 将 该 主题 知识 


点 一 并 提取 出 ， 而 主题 知识 点 是 一 个 


泛 化 的 知识 点 ， 在 能 提取 出 基本 知识 点 的 情况 下 ， 它 通常 是 不 


被 需要 的 。 


五 ”规划 的 计算 机 教材 ， 全 书 共 十 二 章 ， 本 实验 只 研究 介绍 标 
准 C++ 面向 对 象 程 序 设计 技术 的 前 九 章 加。 各 章节 的 主题 知识 
点 及 所 对 应 的 具体 知识 点 的 数量 统计 结果 如 表 1 所 示 。 
表 1 教材 各 章节 主题 知识 点 及 具体 知识 点 数目 统计 结果 
教材 章节 主题 知识 点 具体 知识 点 
第 1 章 C++ 与 面向 对 象 程序 设计 概述 11 34 
第 2 章 C++ 基础 33 99 
第 3 章 类 与 对 象 25 82 
第 4 章 继承 21 53 
第 5 章 多 态 性 8 20 
第 6 章 运算 符 重 载 14 45 
第 7 张 模板 与 STL 12 76 
第 8 章 异常 11 21 
第 9 章 文件 与 流 9 46 
1.5 单 选 题库 


题 都 进 


1.5.1 单 选 题 分 类 


观察 标记 考点 后 的 C++ 单 选 题 ， 笔 者 发 现 单 选 题 的 考点 在 


前 ， 题 库 中 共 储 存 了 1 500 多 道 C++ 单 选 题 ， 笔 者 对 每 
行 了 考点 标记 。 


分 布 是 有 一 定 规 律 的 ， 一 部 分 单 选 题 的 考点 可 通过 


直接 确定 ， 一 部 分 单 选 题 的 考点 要 根据 其 题目 和 选 


题 中 的 位 
分 析 其 题 
项 共同 确定 , 还 
笔者 将 最 


点 位 置 。 


部 分 单 选 题 的 考点 只 分 布 在 其 选 


后 两 种 1 


项 中 ,在 此 ， 


青 况 合 为 一 种 ， 即 通过 分 析 整 道上 


选 题 确定 考 
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录用 稿 


为 实现 单 选 题 


自动 分 类 ， 笔 者 观察 至 


1 第 二 类 单 选 题 的 题目 


中 存在 有 特殊 字符 串 ， 如 “叙述 正确 的 是 ” “正确 的 说 法 是 ” 


过 
外 
| 


等 ， 这 些 字符 


匹配 题目 中 不 包含 个 


“下 列 叙 述 正确 的 是 ”又 可 匹配 题目 包含 3 


含 具体 知识 点 的 单 选 题 ， 
是 ”。 题 库 单 选 题 分 类 结果 见 第 4 章 。 


1.5.2 单 选 题 分 词 


汉语 分 词 是 处 理 中 文 语 料 必 不 可 少 的 一 个 ] 
础 地 位 。 目 前 较为 常用 的 分 词 工具 


中 


语言 处 理 中 居于 卉 


术 平 台 (LTP)、NLPIR 汉语 分 词 系统 、 玫 
自 带 的 中 文 分 词组 件 jieba。 

期 ， 笔 者 曾 尝试 使 用 以 上 这 些 分 词 器 对 中 文 语 料 
期 考虑 到 实验 是 在 Python 环境 中 进行 的 ， 所 以 优 


包 (HanLP) 以 及 Python 
在 实验 前 
进行 分 词 ， 后 
先 考虑 使 用 ji 


eba 分 词组 件 。 


= 


F 源 自 


E 何 考点 的 单 选 题 ， 如 
E 题 知识 点 而 选项 包 
如 “下 列 关于 构造 函数 的 叙述 正确 的 


不 节 ， 其 在 自然 
语言 技 
的 汉语 言 处 理 


GhingXj 全 人 { 期 刊 
刘 一 然 ， 等 : 基于 知识 图 谱 的 学 科 单 选 题 考点 提取 研究 


"knowledge": 
[ 
{ 


"keywords": [" 关 键 词 1"," 关 键 词 2",..…..…. 


"name": "知识 络 称 "， 


"description": [" 关 键 词 1", "关键 词 2",.… 


其 中 ,“keyword” 中 的 关键 词 是 从 知识 点 名 
关键 词 ;“description” 中 的 关键 词 是 知识 点 概念 


词 ， 


某 个 知识 点 的 基础 概念 ， 考 查 方式 分 为 
直接 询问 某 个 知识 点 的 概念 是 什么 ， 另 一 种 考查 方式 则 是 在 单 


建立 该 字典 的 原因 是 : 在 学 科 考 试 中 ， 


称 


种 ， 一 种 是 在 题 


中 提取 出 的 领域 


蕴 述 中 的 关键 


单 选 题 常常 会 考查 


中 


该 分 词组 件 的 优点 在 于 安装 简单 、 调 用 方便 以 及 支持 添加 。” 选 题 的 题目 中 给 出 某 一 知识 点 的 概念 ， 然 后 问 考 查 的 是 哪个 知 
自 定义 词典 。 不同 的 学 科 有 其 特定 的 学 科 词语 ， 当 jieba 词 库 中 识 点 .“description” 就 是 针对 第 二 种 考查 方式 建立 的 。 
未 包含 这 些 词 语 时 ， 分 词 结果 往往 不 尽 人 意 ， 因 此 需要 添加 自 为 完善 领域 知识 ， 本 研究 中 的 知识 图 谱 是 开放 性 的 ， 通 过 
定义 词典 ， 提 高 分 词 准确 率 。 本 系统 中 的 分 词 模块 是 人 机 交互 。 交互 ， 用 户 可 不 断 添加 新 知识 。 


T 


式 的 ， 在 自动 分 词 后 ，) 


户 可 判断 结果 中 


存在 ， 可 以 通过 交互 将 新 词 添加 到 自 定 义 词 
准确 分 词 。 分 词 模块 的 执行 流程 


照 用 户外 


是 否 存在 错 分词 。 若 
中 ， 如 此 便 可 按 


中 


图 2 所 示 。 


| 分词 上 全 


人 机 交互 添加 新 词 


图 2 


系统 分 词 流 


1.5.3 相似 词 替换 


程 


于 汉语 同义词 较 多 且 不 同 出 题 者 对 同义词 语 的 使 用 有 着 


不 同 程度 的 偏好 ， 所 以 需 统一 分 词 后 的 词语 表示 ， 将 意思 表述 


相同 的 词语 统一 为 一 个 最 为 常见 的 词 ， 


该 词语 必须 和 知识 图 谱 


中 知识 点 的 关键 词 用 词 一 致 ， 从 而 便于 后 续 检 索 。 


2 ”知识 图 谱 


为 将 


题 中 考点 对 应 到 教材 章节 ， 


上 
识 点 描述 的 关键 词 。 
2.1 构建 知识 图 谱 


在 构建 知识 图 谱 S 册 时 需 
归纳 总 结 章节 知识 点 ， 提 取 各 个 知识 点 的 名 称 关键 词 和 有 关 知 


将 归纳 总 结 出 的 知识 点 名 称 、 知 识 点 名 称 关键 词 、 知 识 点 


小 


概 
中 


有 
的 存储 形式 如 下 : 


"chapter": "章节 名 称 "， 


述 的 关键 词 以 及 该 知识 点 所 属 章节 储存 在 一 个 json 文件 
。 选 用 json 文件 储存 知识 点 的 原因 在 于 它 是 一 种 人 类 可 读 的 、 
层次 结构 且 易 于 解析 的 文本 数据 交换 格式 。 知 识 点 在 文件 中 


2.2 


检索 知识 图 谱 


2.2.1 匹配 关键 词 得 到 候选 考点 集 


检索 知识 图 谱 是 本 丰 


究 中 最 为 关键 的 一 步 ， 检 索 结 果 将 直 


接 决 定 能 否 成 功 提取 单 选 题 的 考点 。 本 文 第 章节 介绍 可 将 单 选 
题 按 照 其 考点 分 布 位 置 分 为 两 类 ;相应 地 ， 在 提取 知识 点 时 ， 


也 只 坝 允 
索 效率 而 且 可 以 避免 引入 一 些 无 关 考 点 。 


题 中 考点 的 分 布 位 


a) 将 试题 按 其 题目 考点 分 布 进行 分 类 。 


进行 查找 ， 这 样 不 仅 可 以 提高 检 
体 步骤 如 下 : 


试题 集 A: 通过 分 析 题 目 便 可 确定 考点 的 试题 。 
试题 集 B: 通过 分 析 题 目 和 选项 从 而 确定 考点 的 试题 。 


进行 预 处 理 。 


b) 对 两 类 试题 集 分 别 


词 # 


试题 集 A': 将 试题 集 A 中 的 试题 的 题 


行 相似 词 蔡 换 。 


本 
本 


成 功 ， 
失败 , 则 会 与 该 知 
匹配 成 功 的 判断 标 ; 


试题 集 B”′: 对 试题 集 B 中 的 试题 进行 分 词 操作 
的 分 词 结果 进行 相似 词 蔡 换 。 
用 试题 集 A' 去 检索 知识 图 谱 , 得 到 试题 的 候选 考点 集 。 
遍历 试题 集 A” ， 用 本 次 遍历 的 试题 词 


C 


— 


分 


语 集 


人 


d 
方法 同 c)， 这 里 不 


Moet 


了 歼 述 。 


2.2.2 设 定 规则 得 到 准确 考点 


上 述 方 式 得 到 的 考点 
点 和 非 题目 考点 的 情况 。 


某 一 知识 点 的 “keyword” 中 存储 的 关键 词 进行 匹配 ， 若 能 完全 
匹配 ， 便 可 将 知识 点 确认 为 该 单 选 题 的 一 个 候选 知识 点 ， 若 匹 
则 继续 匹配 下 一 知识 点 ; 若 与 “keyword” 中 的 词语 匹 
识 点 的 “description ”中 的 关键 词 进行 匹配 ， 
不 变 ， 若 匹配 失败 ， 则 继续 
识 点 ， 直 至 与 知识 图 谱 中 的 最 后 一 个 知识 点 


用 试题 集 B' 去 检索 知识 图 谱 , 得 到 每 题 的 候选 考点 集 。 


匹配 


与 知识 图 谱 中 


匹配 下 一 个 知 
结束 。 


不 准确 ， 候 选 考点 集中 存在 元 余 考 
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若 单 选 题 考查 的 是 基本 知识 点 ， 用 该 方法 会 将 主题 知识 点 
也 提取 出 来 ， 即 元 余 考 点 。 若 某 几 个 知识 点 其 意思 表述 不 同 但 
关键 词语 相同 ， 例 如 ,“ 友 元 函数 不 是 类 的 成 员 函 数 ” 和 “一 个 
类 的 所 有 成 员 函 数 都 可 以 是 另 一 个 类 的 友 元 函数 ”这 两 个 考点 
都 可 提取 出 “类 ”“ 友 元 函数 ”以 及 “成 员 函 数 ” 这 三 个 词语 ， 
但 两 者 表述 的 意思 不 同 ; 若 题 中 存在 学 科 名 词 和 几 个 通用 的 拱 
述 性 词语 ， 例 如 ， 在 C++ 单 选 题 中 ， 若 题 中 存在 “构造 函数 ” 
“定义 “调用 ”这 三 个 词语 , 便 会 匹配 到 两 个 考点 ,一 个 是 “ 构 
造 函 数 的 定义 ” 一 个 是 “构造 函数 的 调用 ” 仅 根 据 这 三 个 词 
语 的 描述 无 法 确定 题目 究竟 考察 的 是 哪个 考点 。 通 过 设 定 规则 ， 
笔者 消除 了 这 两 种 情况 带 来 的 影响 。 方 法 如 下 : 
a) 删除 元 余 考点 。 
可 比 对 候选 考点 的 名 称 ， 若 某 一 知识 点 的 名 称 字 符 串 是 另 
一 知识 点 名 称 字符 串 的 子囊 ， 即 可 确定 该 知识 点 是 主题 知识 点 
另 一 个 知识 点 是 具体 知识 点 ， 此 时 应 删 去 主题 知识 点 。 

b) 通过 分 析 词 语 在 单 选 题 中 出 现 的 先后 顺序 , 区 分 具有 相 
同 关键 词 的 知识 点 。 
c) 通过 比较 词语 间 的 距离 ,确定 学 科 关键 词 究竟 该 和 哪个 
上述 性 词语 结合 。 

Q@ 计 算 学 科 关 键 词 和 描述 性 词语 在 试题 中 所 处 的 位 置 。 

@ 分 别 计算 学 科 关键 词 与 各 个 描述 性 词语 位 置 距离 的 绝对 


值 。 


@ 绝 对 值 最 小 的 距离 所 对 应 的 描述 性 词语 即 为 所 求 。 
3 ”实验 结果 


3.1 ”试题 分 类 及 分 词 结果 
通过 特殊 字符 串 的 匹配 将 题目 分 为 两 类 , 具体 结果 见 


pa 
(LAD 


国 通过 题目 确定 考点 目 通 过 题目 和 选项 确定 考点 


图 3 依据 题 中 考点 位 置 分 布 的 单 选 题 分 类 


从 饼 状 图 中 可 以 清楚 地 看 出 本 实验 所 搜集 的 单 选 题 中 有 
90% 的 试题 通过 分 析 题 目 便 可 确定 考点 。 
在 语 料 处 理 时 ， 比 较 了 自动 分 词 的 准确 率 和 添加 自 定义 词 
典 后 的 分 词 准确 率 。 有 具体 情况 见 图 4。 

从 图 4 可 看 出 ， 自 动 分 词 的 正确 率 只 有 60%， 这 远 不 能 满 
足 后 续 分 析 的 需求 , 添加 自 定义 词典 后 , 准确 率 提 高 到 了 96%， 
极 大 地 减弱 了 分 词 结果 对 考点 提取 准确 率 的 影响 。 


1.00 


hinaX Ny 期 刊 
溢 的 学 科 单 进 通 考点 提取 研究 


U.U4 


0.80 


0.60 


0.40 


0.20 


0.00 


自动 分 词 人 机 交互 分 词 


四 正确 率 目 错 误 率 


3.2 ”匹配 知识 图 谱 结果 
实验 过 程 中 ， 通 过 匹配 题 中 关键 词 


图 4 自动 分 词 与 添加 自 定 义 词典 后 的 分 词 准确 率 对 比 图 


与 知识 图 谱 中 知识 点 的 


关键 词 ， 得 到 单 选 题 的 候选 考点 集 。 


体 情 况 见 表 2。 


表 2 候选 考点 集 的 组 成 情况 


是 否 存在 准确 题目 考 是 否 存在 元 余 考 是 否 存在 非 题目 考 题目 所 占 比 
点 


点 点 点 例 
是 是 否 38% 
是 是 是 13% 
是 否 否 33% 
是 否 是 16% 


表 2 说 明 ， 通 过 检索 知识 图 谱 、 直 


到 准确 考点 的 题目 数 占 总 题目 数 的 比重 
然 不 能 满足 实际 需要 。 针 对 这 一 现象 ， 
大 提高 了 准确 率 。 具 体 情 况 见 表 3。 


接 匹 配 题 目 词语 ， 能 得 
约 为 33%， 这 一 结果 显 
笔者 设计 学 科 规则 ， 极 


表 3 匹配 规则 结果 


能 提取 出 准确 考点 不 能 提取 出 准确 考点 


97% 


3% 


从 表 3 结果 可 知 ， 经 过 规则 的 处 理 


到 97%。 

分 析 通 过 规则 匹配 不 能 得 到 准确 考 
目的 特点 往往 是 题 中 存在 较 多 的 学 科 名 
用 的 描述 性 词语 组 合 ， 会 得 到 较 多 的 元 
这 会 极 大 地 影响 最 终结 果 。 后 期 将 尝试 
类 试题 的 考点 。 


4 ”结束 语 


， 考 点 提取 的 准确 率 达 


点 的 题目 ， 发 现 这 类 题 
词 ， 这 些 学 科 名 词 与 通 
余 考 点 和 非 题目 考点 ， 
通过 语义 分 析 来 提取 这 


研究 表明 ， 通 过 检索 学 科 知 识 图 谱 


和 匹配 学 科 规 则 可 准确 


提取 学 科 单 选 题 考点 。 本 研究 提出 的 方 


法 有 助 于 教师 和 学 生 对 


错 题 考点 的 分 析 ， 故 可 将 其 应 用 于 学 校 


教育 。 具 体 地 ， 对 于 学 


生 ， 错 题 考点 其 实 就 是 他 尚未 完全 掌握 
出 的 方法 能 快速 且 准 确 地 将 考点 定位 到 


[=3 


从 而 决定 之 后 的 题目 讲解 重点 。 


生 学 习 。 对 于 教师 ， 本 方法 可 帮助 他 迅 


的 学 科 知 识 ， 本 研究 提 
教材 章节 ， 从 而 便于 学 
速 提取 学 生 错 题 考点 ， 
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